EE 、。 


本 稿 で は , 米国 Altera 社 が 発売 し た 高速 キト ランシー バ 内 蔵 
FPGA TArria GX」 に つい て 紹介 する . 本 FPGA を 使用 し た 場 
合 の PCI Express 伝送 の 実力 値 を 計測 し て みた . (編集 部 ) 


高速 トラ ン シ ー バ 内 蔵 「Arria GX」 と は 


FPGA は 技術 的 に 難易 度 の 高い PCI Express の 実装 を , 比較 
的 容易 に し て くれ る デバ イス で す . メー カ か ら 提 供 され る 開発 
キッ ト ( 評価 ボー ド ) を 参考 に すれ ば , ボー ド 設計 に お いて も 大 
き な 助 け に な り ま す . 

「 Arria GX」 は 米国 Altera 社 か ら 提供 され る 高速 トラ ン シ ー 
バ を 内 蔵 し た 低 コ スト FPGA で ず 写真 1). Arria GX は PCI 
Express, ギガ ・ ビ ッ ト Ethernet, Serial RapidIO の 3 種類 の 
プロ ト コル を サポ ー ト し ます . 表 1 に Arria GX の ライ ン ナ ッ プ 
を 示し ます . 

大 ま か な 値 で す が , DDR2 メ モリ コン ト ロー ラ で 2000LE 

( Logic Element), PCI Expres% x4) で 12000LE ほど 使用 し ま 
す . 例え ば , Altera 社 の 評価 ボー ド に 搭載 され て いる 
EP1AGX60 は , 約 60000LE の 規模 で す . メモ 
ラ と PCI Express の IR Intellectual Property ) コア を 実装 し て 
も , か な り 余裕 が あり そう で す . 

x1 の PCI Express を 実装 し た い だ け な ら ば 一 番 小 規模 の 
EP1ACX20C を 選択 すれ ば よい で し ょ う . PCI Express の ほか 
に Serial RapidIO な どの 別 の 高速 イン ター フェ ー ス が 必要 な 場 


に 


・ コ ント ロー 


内 
/AH[ 叶 RAN 
= mW ) 写真 2 
rrxg” 今回 使用 し た 評価 ボー ド の 外観 
本 評価 ボー ド は PCI Express アド イン ・ カ ー ド 
MAABSX07SA に な っ て いる た め , この まま パソ コン の スロ ッ 
AA ト に 挿入 し て 使え る . また , コン フィ グレ ー 
ショ ン 用 フラ ッシュ ・ メ モリ や DDR2 メ モリ 
を 搭載 し て いる . 価格 は 995 ド ル で , Altera 社 
の 販売 代理 店 か ら 購 入 で きる ( 国内 価格 は 販売 
写真 1 Arria GX の 外観 代理 店 に 問い 合わ せ の こと ). 
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最新 の 高速 トラ ン シ ー バ 内 蔵 
FPGA の 実力 


合 や , 大 規模 な ユー ザ 回 路 を 実装 する 必要 が ある の な ら 
EP1AGX60, EPIAGX90 と 大 規模 な も の を 選択 で きま す . 


Arria GX の PCI Express 転送 の 実力 


@ Arria GX 評 価 ボ ー ド の 概要 

Altera 社 が 提供 する Arria GX 評価 ボー ド は , パソ コン の PCI 
Express スロ ッ ト に その まま 挿入 し て 評価 で きま ず 写真 2). ま 
た , 電源 アダ プ タ か ら 電 源 を 供給 する こと に より ボー ド 単体 で 
も 動作 させ られ ます . この ボー ド を 使え ば , 自分 が 開発 し て い 
る ボー ド が 完成 する 前 に FPGA 内 の PCI Express 周辺 の 回 路 や , 
オリ ジ ナ ル の 回 路 の 動作 を チェ ッ ク で きま す . ブロ ッ ク 図 を 
1 に 示し ます . 
回 路 図 や ガー バ ・ デ ー タ も 提供 され る の で , 電源 周り や DDR2 
メモ リ , PCI Express な どの ボー ド 設計 の 参考 に な る と 思い ま 
す . FPGA 内 蔵 の 温度 検知 ダイ オー ド や 温度 セン サ を 使っ た ファ 
ン の コン ト ロー ル 回 路 が 搭載 され て いま す . コン フィ グレ ー シ ョ 
ン に は フラ ッシュ ・ メ モリ と 制御 用 CPLR MAX II) を 搭載 し 
て いま す . ボー ド は FR-4 の 6 層 基 板 で す . 


念 測定 系 を 構築 

本 評価 ボー ド を 使っ て Arria ( 衣 の PCI Express 転送 速度 を 測 
定 し て み ま し た . 使用 し た パソ コン は , 米国 Dell 社 の Pre 
cision 470 WorkstatioW チッ プ セ ッ ト は Intel E7525) で す . この 


山腹 肖 川 川 川 由 


で 


/ ら 5? ぐ の すべ て 58 
表 1 Arria GX の 種類 2007 年 10 月 現在 ) 


項 目 EP1AGX20C | EP1AGX35C/D EP1AGX50C/D EP1AGX60C/D/E EP1A GX9OE 

、 484 ピ ン , 

に 780 ピ ン 

等 価 LE 数 21.580 50160 60100 90220 

(222 
チャ ネル 数 


ラン シー/ ノ ヾ ・ ・ テ 
ME 9 0 に 1.25Gbps, 25Gbps | 125Gbps, 25Gbps 125Gbps, 25Gbps 1 


HS MC 図 
Fast Passive Parallel 隊 NM 229 9 


( FPP) Mode CMOS/LVDS 図 
x4 ト ラン シー バ 図 


コン フィ グレ ーション 図 3.3V CMOS 
3.3V CMOS AIERAW 


484 ピ ン | 780 ピ ン | 484 ピ ン | 780 ピ ン | 484 ピ ン | 780 ピ ン | 1152 ピ ン 1152 ピ ン 


4 4 8 12 


図 1 
Arria GX 評価 ボー ド の ブロ ッ ク 図 
Arria GX の ほか に フラ ッシュ ・ メ モ PCI Express 

リ か ら の コン フィ グレ ーション を 制 REFCLK x4 ト ラン シー ババ 図 
御 す る た め , CPLD MAX Il) が 搭載 
され て いる . HSMC は 拡張 用 の コネ 
クタ と し て 使用 する . 


パソ コン の x16 ス ロッ ト に 本 評価 ボー ド を セッ ト し まず 写真 3). 

今回 は Arria ( 文 の PCI Express 性能 を 試す た め に DMA 

( Direct Memory Access) 転送 リー ド / ラ イト ) を 実行 し まし 
た . デー タ の 流れ は 図 2 の よう に な り ま す . 

DDR2 メ モリ コン トロ ー ラ と PCI Express は Altera 社 の 

「 OpenCore Plus IP メガ ファ ンク ショ ン 」 と 呼ば れる IP コア を 利 

HH し ます . OpenCore Plus IP メガ ファ ンク ショ ン は 有償 の も の 

で も , 無償 で 評価 する こと が で きま す . GUI Graphical User 

Interface) に よっ て パラ メー タ を 設定 で きる の で 非常 に 便利 で す . 


渦 
人 


人 @ PCI Express x4 DMA 転 送 速度 を 測定 

実際 に デモ ンス トレ ーション を 実行 し て み ま し た . 図 3 a) 
が DMA リ ー ド を 実行 し た 結果 で す . 655M バイ ト /s で デー タ 
を 転送 し まし た . 

次 に DMA ライ ト を 実行 する と 889M バイ ト /s で デー タ を 伝 
送 し まし 丸 図 3 b)〕. 

この 結果 を 考察 し て み ま し ょ う . PCI Express x4 の 物理 速度 
は 25Gbps で 4 レー ン な の で 10Gbps で す . 8b/10b 符合 が ある 
の で 実際 の デー タ 伝送 速度 は , 10Gbps X 8/10= 8Gbps = 1G バ 
イト /s = 1024M バイ ト /s で す . 

ここ に プロ ト コル 上 の 処理 と し て , ペイ ロー ド に 対し て 各 レ 
イヤ に 追加 され る ヘッ ダ / フ ッ タ , ACK/NAK パ ケッ ト の や り 


( b) スロ ッ ト に 本 評価 ボー ド を 差し た と ころ 
写真 3 転送 速度 測定 系 の 組み 立て 


今回 使用 し た パソ コン は スロ ッ ト が 少な く , スペ ー ス も 非常 に 狭い た め , 


と りな どの 速度 低下 要素 が あり ます . ボー ド の 挿入 が や や た い へ ん だ っ た . 使用 する PCI Express スロ ッ ト の 隣 に 
ビデ オ ・ カ ー ド を 挿入 し な けれ ば な ら ず , ボー ド 同士 が ぶつ か ら な いか 心配 
使用 する パソ コン に よっ て も 違い ます が 理論 上 の 最大 転送 レー だ っ た . と りあ え ず 問題 な く 無事 に 挿入 する こと が で きた -. 


Design Wave Magozine 2007 December 77 


パソ コン 凶 


メモ リ 図 


2 
転送 速度 測定 の イメ ー ジ 
Arria GX に よる エン ド ポイ ント DMA 


Altera PCI Express ボー ド 凶 
Arria GX 


エン ド ポ イン ト 図 請 
DMA リ ー ド 図 


DMA Engine 


エン ド ポイ ント 較 


DMA ラ イト 
リー ド お よび エン ド ポ イン ト DMA ラ 諸語 de ァ イ ト KR 較 
イト . 実際 に は パソ コン の メモ リ と 5 PCI Express x4 
チッ プ セ ッ ト 
Arria GX 評価 ボー ド 上 の DDR2 メ モ に PCIExpress 図 。 DDR2 錠 
リ と の 間 で PCI Express を 介し て メガ ファ ンク ショ ン 凶 メガ ファ ンク ショ ン 鐘 
デー タ が 転送 され る . エン ド ポイ ント 図 
回 | 
Performance (MB/s) Performance (MB/s) 
mw mw 加 し | 画 
アリ プー アンク スケ ァ /= ュ ンジ 昌 時 軒 
ぐ く ミ 2 ョ = mi = ぐ ミ 2c ョ i 
2 に 日 日 日 Transfer leneth bytes) hOO000 呈 時 H 
ae Med も es 6 ョ 計 ds 宮 ョ = 
KV し 吾 三 曰 に EE 
PCI Ex 196 に が) 6 x4) 転送 速度 Number of derations 加 - 量 Number of Nerations fo | 時 
測 定 Bosd Peak Averawe lsst 5 ーーー Fe 人 Average lsst 
ea 655 654 655 は ra PCp st0 899 5 に 


( a) は PCI Express x4 の DMA 
リー ド 画面 . 100000 バ イト の 
デー タ を 10 回 DMA 転 送 リー ド 
の み ) し て , 実際 の 性 能 を 検証 し 


- Dats 
yles cn-chp memory buffer 


ptor- Das 
yles on-chip memory bufler 


た . ( b) は PCI Express x4 の 
DMA ラ イト の 画面 . 100000 バ 


【@ewa ww es つ ェ ーーーー〈DMA リ ー ド 655M バ イト /s ) = 


(Geww we ジェ ーーーー〈DMA ラ イト 899M バ イト /s ) = 


「 Centneus lsep 


イト の デー タ を 10 回 DMA 転送 
( ライ ト の み ) し て , 実際 の 性 能 
を 検証 し た. 


ト は , リー ド で 750M バイ ト /s, ライ ト で 900M バイ ト /s く ら 
いで す . 

Arria GX の DMA 転送 速度 の 実測 値 は . リー ド が 655M バイ 
ト /s, ライ ト が 889M バイ ト /s で し た . 理論 値 を 考え る と 優秀 
な 性 能 を 示し て いる と いえ る で し ょ う . 

ちな み に , ライ ト より リー ド が 遅い の は チッ プ セ ッ ト の 制限 
に より 64 バ イト の パケ ッ ト で 転送 する た めで す . この サイ ズ は 
チッ プ セ ッ ト に よっ て 違い ます . 

今回 は と りあ え ず Arria CX 評価 ボー ド を 使用 し た PCI 
Express の 動作 確認 に と ど め て いま す が , 実際 の 設計 に お いて 


/HT 


さ 


は ユー ザ 回 路 を 組み 込ん で 同様 の 環境 で デバ ッ グ で きま す . ほ 
か の デバ ッ グ ・ ツ ー ル な ども 利用 すれ ば 効率 の 良い 開発 が 行え 
る で し ょ う . 


@ PCI Express 開発 の 注意 点 

最後 に PCI Express を 扱う 上 で 注意 すべ き 点 を 述べ ます . PCI 
Express を 実装 する 上 で よく 遭遇 する トラ ブル は , パソ コン の 
メイ ン ・ ボ ー ド の BIOS の 問題 で す . 例え ば , x1 は 正常 に 動作 
する が x4 は 動か な い ケ ー ス や , 特定 の スロ ッ ト で は 正常 に 動作 
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Rn 


( a) DMA リー ド 結果 


「 Cetnous loop 夫 ] 


( b) DMA ライ ト 結果 


する が それ 以外 の スロ ッ ト で は 動作 し な い ケ ー ス な ど が あり ま 
す . 少し 古い メイ ン ・ ボ ー ド を 使う 場合 に は , BIOS を 新しく 
し て お く こと を お 失 め し ます . 

PCI Express の よう な 新しい イン ター フェ ー ス を 初め て 採用 
する 場合, エン ジニ ア に と っ て は か な り リ スク が 高く 大 変 な イ 


3! 


業 に な り が ち で す . 今回 の よう に , 評価 ボー ド を 使っ て あら か 
じ め PCI Express や ユー ザ 回 路 を 評価 で きれ ば , か な り の 負担 
軽減 に な る は ず で す . 
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